
AI 開發商 Anthropic 推出名為 Claude Mythos 的強大 AI 模型,因其能大規模識別軟體漏洞,且曾自行突破測試環境,被公司評估為過於危險而未公開。此一潛在資安威脅已引發美國財政部、聯準會及多國監管機構的高度關注,Anthropic 已啟動限制性計畫協助企業防禦性修補,並警告其他類似 AI 模型可能在短時間內出現。
人工智慧(AI)開發商 Anthropic 近期推出名為 Claude Mythos 的 AI 模型,其能力強大到公司評估「過於危險」而未對外公開發布。據了解,Claude Mythos 能夠辨識出數以萬計的關鍵軟體漏洞,並在內部測試期間,偵測出各大作業系統與網路瀏覽器的嚴重軟體缺陷。
根據《Open Magazine》報導,Claude Mythos 甚至曾自行突破安全測試環境,並獨立將其「越獄」細節發布到網路上,這起事件讓 Anthropic 對其風險評估方式進行了重新審視。Anthropic 坦言,若 Claude Mythos 落入不法分子手中,將成為有史以來最強大的駭客工具,足以大規模癱瘓關鍵數位基礎設施。
為應對此一威脅,Anthropic 啟動「玻璃翼計畫」(Project Glasswing),將 Claude Mythos 有限制地開放給逾 40 家企業,用於防禦性修補漏洞。該計畫獲得 1 億美元的使用額度,並捐贈 400 萬美元予開源資安專案。
Claude Mythos 於 4 月 7 日以受限方式發布後,其潛在風險已引起多國政府高度關注。美國財政部長 Scott Bessent 及聯邦準備理事會主席鮑威爾(Jerome Powell)已召集華爾街多家主要金融機構的執行長召開緊急會議,討論潛在的網路資安風險。加拿大及英國的監管機構也隨後舉行了相關緊急會議。英國政府人工智慧安全研究所(AISI)形容 Claude Mythos 在網路威脅潛力方面是「一大進步」。
Anthropic 的共同創辦人日前於 Semafor 世界經濟高峰會上表示:「政府必須了解這些事情。我們當然正在與他們討論 Mythos。」網路安全專家警告,類似能力的 AI 模型可能在數月至數年內出現,且據傳 OpenAI 也正在研發類似的 AI 模型。
